Epoch 9 - 視線估計論文筆記 x SimGAN - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

第 12 屆 iThome 鐵人賽

DAY 9

AI & Data

AI x 日常 x 30天系列第 9 篇

Epoch 9 - 視線估計論文筆記 x SimGAN

12th鐵人賽

AlittleQ

2020-09-19 23:16:29

1045 瀏覽

分享至

今天介紹Gaze Estimation視線估計的論文，
Learning from Simulated and Unsupervised Images through Adversarial Training

這是Apple第一篇發表的AI論文，拿到2017 CVPR Best Paper，

論文主要的思路是，
我們都知道模型要學得好，訓練集需要越大，但是標注資料的成本很高。
所以有些會使用模擬器，合成大量資料，但合成資料和真實資料還是會有差距存在，
因此本文的目的是要訓練一個Refined網絡，
使得模擬器生成的合成圖片經改善後能更貼近真實圖片。

論文中提到，可能會產生artifact的原因是，
當我們只使用一個Discriminator時，Refiner為了要欺騙他，可能會過度強調某些global特徵，
進而使得Refined圖像出現不自然的artifact。
所以把他分割為w×h個小塊來看，限制Discriminator只能看這一小塊，去判斷是不是真實的圖片
最後再把所有小塊的loss加起來。

實驗結果比較，用global loss refined的圖片，在邊緣上有劇烈的抖動，
而採用local loss的就比較平滑，符合真實情況。